We propose a novel method for high-quality facial texture reconstruction from RGB images using a novel capturing routine based on a single smartphone which we equip with an inexpensive polarization foil. Specifically, we turn the flashlight into a polarized light source and add a polarization filter on top of the camera. Leveraging this setup, we capture the face of a subject with cross-polarized and parallel-polarized light. For each subject, we record two short sequences in a dark environment under flash illumination with different light polarization using the modified smartphone. Based on these observations, we reconstruct an explicit surface mesh of the face using structure from motion. We then exploit the camera and light co-location within a differentiable renderer to optimize the facial textures using an analysis-by-synthesis approach. Our method optimizes for high-resolution normal textures, diffuse albedo, and specular albedo using a coarse-to-fine optimization scheme. We show that the optimized textures can be used in a standard rendering pipeline to synthesize high-quality photo-realistic 3D digital humans in novel environments.
translated by 谷歌翻译
获取房间规模场景的高质量3D重建对于即将到来的AR或VR应用是至关重要的。这些范围从混合现实应用程序进行电话会议,虚拟测量,虚拟房间刨,到机器人应用。虽然使用神经辐射场(NERF)的基于卷的视图合成方法显示有希望再现对象或场景的外观,但它们不会重建实际表面。基于密度的表面的体积表示在使用行进立方体提取表面时导致伪影,因为在优化期间,密度沿着射线累积,并且不在单个样本点处于隔离点。我们建议使用隐式函数(截短的签名距离函数)来代表表面来代表表面。我们展示了如何在NERF框架中纳入此表示,并将其扩展为使用来自商品RGB-D传感器的深度测量,例如Kinect。此外,我们提出了一种姿势和相机细化技术,可提高整体重建质量。相反,与集成NERF的深度前瞻性的并发工作,其专注于新型视图合成,我们的方法能够重建高质量的韵律3D重建。
translated by 谷歌翻译
Industrial Internet of Things (IoT) systems increasingly rely on wireless communication standards. In a common industrial scenario, indoor wireless IoT devices communicate with access points to deliver data collected from industrial sensors, robots and factory machines. Due to static or quasi-static locations of IoT devices and access points, historical observations of IoT device channel conditions provide a possibility to precisely identify the device without observing its traditional identifiers (e.g., MAC or IP address). Such device identification methods based on wireless fingerprinting gained increased attention lately as an additional cyber-security mechanism for critical IoT infrastructures. In this paper, we perform a systematic study of a large class of machine learning algorithms for device identification using wireless fingerprints for the most popular cellular and Wi-Fi IoT technologies. We design, implement, deploy, collect relevant data sets, train and test a multitude of machine learning algorithms, as a part of the complete end-to-end solution design for device identification via wireless fingerprinting. The proposed solution is currently being deployed in a real-world industrial IoT environment as part of H2020 project COLLABS.
translated by 谷歌翻译
本文通过像素保留算法和深度增强学习(DRL)决策逻辑的结合,为CAV提供了无信号的交叉控制系统,然后是对拟议模型的走廊级影响评估。像素保留算法检测到潜在的碰撞操作,DRL逻辑优化了车辆的运动,以避免碰撞并最大程度地减少交叉路口的整体延迟。拟议的控制系统称为分散的稀疏协调系统(DSCLS),因为每辆车都有自己的控制逻辑,并且仅在协调状态下与其他车辆互动。由于在DRL的培训课程中采取随机行动的链条影响,训练有素的模型可以应对前所未有的体积条件,这在交叉管理中构成了主要挑战。将开发模型的性能与传统和基于CAV的控制系统进行了比较,包括固定的交通信号灯,驱动的交通信号灯以及最长的队列第一(LQF)控制系统,在Vissim软件中四个交叉路口的走廊中,在三个卷机制下进行了比较。模拟结果表明,与其他基于CAV的控制系统相比,提出的模型在中等,高和极端体积方案中将延迟减少了50%,29%和23%。旅行时间,燃油消耗,排放和替代安全措施(SSM)的改善也很明显。
translated by 谷歌翻译
非线性状态估计(SE)的目的是根据电力系统中所有可用的测量值估算复杂的总线电压,通常使用迭代的高斯 - 纽顿方法来解决。在考虑来自相组量测量单元以及监督控制和数据采集系统的输入时,非线性SE会带来一些困难。这些包括数值不稳定性,收敛时间取决于迭代方法的起点以及单个迭代在状态变量数量方面的二次计算复杂性。本文在非线性功率系统SE的增强因子图上介绍了基于图形神经网络的原始SE实现,能够在分支机构和总线上进行测量,以及相法和遗留测量。提出的回归模型在一旦训练的推理时间内具有线性计算复杂性,并且有可能实现分布式。由于该方法是非词语且基于非矩阵的,因此它对高斯求解器容易出现的问题具有弹性。除了测试集的预测准确性外,提出的模型在模拟网络攻击和由于沟通不规则引起的不可观察的情况时表现出了鲁棒性。在这种情况下,预测错误在本地持续存在,对电力系统的其余结果没有影响。
translated by 谷歌翻译
第五代(5G)网络具有加速电源系统过渡到灵活,软焊,数据驱动和智能网格的潜力。凭借对机器学习(ML)/人工智能(AI)功能的不断发展的支持,预计5G网络将启用新颖的以数据为中心的智能电网(SG)服务。在本文中,我们探讨了如何将数据驱动的SG服务与共生关系中的ML/AI-ai-5G网络集成在一起。我们专注于状态估计(SE)作为能源管理系统的关键要素,并专注于两个主要问题。首先,我们以教程的方式介绍了如何将分布式SE与5G核心网络和无线电访问网络体系结构的元素集成在一起的概述。其次,我们介绍并比较了基于以下方面的两种强大的分布式SE方法:i)图形模型和信念传播以及ii)图形神经网络。我们讨论了他们的性能和能力,以考虑到通信延迟,通过5G网络支持接近实时的SE。
translated by 谷歌翻译
在这项工作中,我们提出了一个端到端双耳语音合成系统,该系统将低抑制音频编解码器与强大的双耳解码器结合在一起,该解码器能够准确地进行语音双耳化,同时忠实地重建环境因素,例如环境噪声或混响。该网络是经过修改的矢量定量变异自动编码器,经过训练,采用了几个精心设计的目标,包括对抗性损失。我们在具有客观指标和感知研究的内部双耳数据集上评估了所提出的系统。结果表明,所提出的方法比以前的方法更接近地面真相数据。特别是,我们证明了对抗性损失在捕获创建真实听觉场景所需的环境效果中的能力。
translated by 谷歌翻译
我们提出了一个单阶段的休闲波形到波形多通道模型,该模型可以根据动态的声学场景中的广泛空间位置分离移动的声音源。我们将场景分为两个空间区域,分别包含目标和干扰声源。该模型经过训练有素的端到端,并隐含地进行空间处理,而没有基于传统处理或使用手工制作的空间特征的任何组件。我们在现实世界数据集上评估了所提出的模型,并表明该模型与Oracle Beamformer的性能匹配,然后是最先进的单渠道增强网络。
translated by 谷歌翻译
在联合学习(FL)的跨设备中,通过使用更新而不是潜在的私人数据来交换参数,具有低计算功率的客户培训常见的\ Line Break [4]机器模型。联合辍学(FD)是一种通过选择要在每个训练回合中更新的模型参数的\ emph {subset}来提高FL会话的通信效率的技术。但是,与标准FL相比,FD产生的精度较低,并且面对更长的收敛时间。在本文中,我们利用\ textit {编码理论}来增强FD,通过允许在每个客户端使用不同的子模型。我们还表明,通过仔细调整服务器学习率超级参数,我们可以达到更高的训练速度,同时也达到与无辍学案例相同的最终精度。对于EMNIST数据集,我们的机制达到了NO辍学案例最终准确性的99.6%,同时需要$ 2.43 \ tims $ $ $ $ $ $ $ $ $ $ $ $ $ $ $ $ $ $ $ $ $ $ $ $ $ $ $ $ $ $ $ $ $ $ $ $ $ $ $ $ $ $ $ $ $ $ $ $ $。
translated by 谷歌翻译
状态估计(SE)算法的目标是基于电力系统中的可用测量集来估计复杂的总线电压作为状态变量。因为相量测量单元(PMU)越来越多地用于传输电力系统,所以需要一种快速SE求解器,可以利用PMU高采样率。本文提出培训图形神经网络(GNN),以了解给PMU电压和电流测量作为输入的估计,目的是在评估阶段期间获得快速和准确的预测。使用合成数据集接受GNN,由电力系统中的随机采样的测量集创建并用使用带有PMU求解器的线性SE获得的解决方案来标记它们。所呈现的结果显示了各种测试场景中GNN预测的准确性,并将预测的灵敏度解决对缺失的输入数据。
translated by 谷歌翻译